Программы построения глобального и локального выравнивания


На главную страницу семестра

Для выполнения задания были подготовлены три файла с аминокислотными последовательностями в FASTA формате:
  1. myprot.fasta - аминокислотная последовательность вашего белка;
  2. secondprot.fasta - последовательность одного из белков, найденных мной при выполнении заданий 4 и 5 занятия 2;
  3. thirdprot.fasta - искусственно созданная последовательность, склеенная из двух небольших (10-12 букв каждый) участков аминокислотной последовательности моего белка.

Последующие действия выполнялись на сервере kodomo-count.cmm.msu.ru.

1. Выравнивание последовательностей со схожей функцией (возможных гомологов)

  1. Первым делом мы построили глобальное выравнивание последовательностей из myprot.fasta и secondprot.fasta с помощью программы needle. Результат сохранили в файле 1to2.needle .
  2. Затем построили локальное выравнивание последовательностей из myprot.fasta и secondprot.fasta с помощью программы water и сохранили результат в файле 1to2.water .
Результаты:
Общие параметры программ были заданы по умолчанию и мы видим, что они одинаковы. Мой белок не большой и с белком DPO3E_BUCAI имеет высокий процент сходства, поэтому различий между локальным и глобальным выравниванием не так много, но они все же есть. Во-первых, в локальном выравнивании выбран участок, который обладал максимальной гомологией, поэтому в выравнивании не было первых 6 аминокислот моего белка и 4 DPO3E_BUCAI, а так же последних двух аминокислот в обоих белках. Во-вторых, не на много изменилось количество идентичных и схожих аминокислот (со 112 до 111 и с 167 до 165), при этом изменился процент идентичности, сходства и гэпов. Вместе со всем этим изменился и общий счет выравнивания (с 574 до 581), стал больше, так как не были учтены концы.

2. Выравнивание последовательностей, содержащих общие участки


  1. Аналогично предыдущему заданию построилиглобальное выравнивание последовательностей из myprot.fasta и thirdprot.fasta с помощью программы needle. Результат сохранили в файле 1to3.needle, затем построили локальное выравнивание последовательностей из myprot.fasta и thirdprot.fasta с помощью программы water и сохранили результат в файле 1to3.water.
  2. Построили локальное выравнивание последовательностей из myprot.fasta и thirdprot.fasta с помощью программы matcher с выводом трех наилучших вариантов. Результат сохраните в файле 1to3.matcher. Результаты: Мы получили различные варианты построения выравнивания, при глобального выравнивании машина нашла оба кусочка последовательности по 11 аминокислот в последовательности моего белка, и общий счет составил 58.5; при локальном выравнивании мы видим только один кусочек (первый), так как в данном случае мы ищем отдельные части, но при этом мы можемзаметить, что оказывается выравнивание произошло не только по первому используемому мной кусочку, но и захватило еще две аминокислоты, так как получилось так, что вторая из последующих аминокислот (которую я не включал в первый кусок, но была во втором куске), оказалась близкой по свойствам с аминокислотой стоящей на том месте в последовательности моего белка, в резулььтате мы получили счет 59. При выранивании с помощью программы matcher мы получили три наилучших локальных выравнивания: одно из них совпадало с локальным выравниванием через программу water, другое - второй выбранный мной кусок из моего белка, а третье выравнивание было сравнительно неудачным по сравнению с предыдущими (59, 59, 22) и представляло случайное совпадение.

3. Параметры программ построения выравниваний

В эотм задании было построены глобальные выравнивания последовательностей из myprot.fasta и thirdprot.fasta с помощью программы needle при разных значениях параметра штрафа за открытие гэпа. Значение штрафа за продолжение гэпа установите равным 1. Полученные результаты находятся ниже.
Результаты:
Параметрами штрафа за открытие гэпа были выбраны чмсла 10, 5, 1. В первом случае (10, см. файл 1to3_10_1.needle) , общий счет выравнивания составил 50.0, при этом выравниавние было сделано таким образом, что кусочки последовательности находились на небольшом расстоянии, дело в том, что я брал два куска лежащих на большом расстоянии, поэтому программа не поставила их в соответствие с местами, откуда они были взяты (будь это расстояние меньше, программа наверняка поставила бы их в соответствие), также надо добавить, что короткая последовательность все же была разделена на две части, так как оказалось, что помимо полного соответствия второго куска, для первого так же нашлось две одинаковые и одна близкая аминокислоты, именно поэтому последовательности были разделены не смотря на большой штраф за гэп.
Во втором случае (5, см. файл 1to3_5_1.needle), общий счет выравнивания составил 58.0, выравнивание сделано практически так же как в предыдущем случае, но в соответствие к первому участку была поставлена еще одна аминокислота (I), причем она оказалась с обоих сторон ограничена двумя гэпами (оба открывающие), что было очень не выгодно в первом случае, где за гэп были очень большие штрафы (по сравнению с данным случаем). Так как за открывающие гэпы снималось меньше то и счет оказаля больше.
В третьем случае (1, см. файл 1to3_1_1.needle), штрафы за гэп открывающий и продолжающий были равны, а соответственно программа построила просто выравнивание такое, чтобы как можно больше аминокислот совпадало, правда в окрестности не оказалось очень хороших вариантов, поэтому выравнивание изменилось не сильно, и счет (69) изменился в основном из-за того, что штраф за открывающий гэп был еще ниже.

4. Карта локального сходства

Построили карту локального сходства последовательностей из myprot.fasta и thirdprot.fasta с помощью программы dotmatcher, построения проводились при различных параметрах: размер окна, порог на суммарный вес. Результаты занесены в таблицу:
Размер окна Порог на суммарный вес Результаты
10 23 Первая карта была построена при стандартных условиях, в результате мы получили выравнивание последовательности, чтобы ее вес был не менее 23, а размер окна 10, то есть программа выравние проводилось по участкам в 10 аминокислот. Так же мы можем глядя на карту сказать, где расопложены совпадающие последовательности. Результат вы можете увидеть сдесь dotmatcher.ps .
3 23 В результате мы ничего не получили, по-видимому, программа искала таким образом, чтобы порог счета за выравнивание по трем аминокислотам составлял не менее 23, а такого не могло быть, так как за суммарное совпадение давали меньше, для проверки этого предположения следует провести поиск с меньшим значением порога.
3 15 При данном значении порога программа вновь показывает выравнивание, поэтому сделанное предположение, по-видимому, верно, то есть мы видим участоки маинокислотных последовательностей, которые совпадают по тройкам, при которых значение Score для каждой тройки больше 15.
22 23 В данном случае мы сделали размер окна 22 и искали по последовательности такие участки, где счет более 23, программа выдала нам 2 участка по 22 аминокислоты, при этом мы знаем, что в этих участках всего по 11 совпадающих аминокислот, но так как размер окна 22, то нам и показывают весь участок в 22 аминокислоты.
23 23 Мы зашли за порог окна на экране, но программа продолжает показывать линии.
29 23 Это значение, начиная с которого программа выдает непоонятную картину, которая к делу не относится.
11 50 Данные значения выбраны не случайно, 11 - число аминокислот полностью совпадающих,при этом мы видим два выравнивания.
11 59 Это интересная точка для выравнивания моей последовательности, дело в том, что выравнивание провелось таким образом, что в одной части аминокислот совпажающих и близких больше чем в другой, поэтому на картине мы и видим лишь одну линию, соответствующую втоорму участку выравнивания.


©Метелев Михаил